Adaptación de bajo rango con restricción de espacio nulo para desaprendizaje de LLM
Descubre cómo NSRU permite desaprender conocimiento no deseado en LLMs preservando capacidades benéficas mediante adaptación de bajo rango con espacio nulo.
Descubre cómo NSRU permite desaprender conocimiento no deseado en LLMs preservando capacidades benéficas mediante adaptación de bajo rango con espacio nulo.
Descubre el fenómeno de rotación del conjunto correcto en RLVR, donde modelos olvidan problemas resueltos. Conoce REMIND, una técnica que mejora la retención sin costo adicional.
¿RLVR olvida lo que aprendió? Descubre la rotación del conjunto correcto y cómo Remind lo corrige sin coste. Mejora tus modelos.
Descubre cómo MAAT, un nuevo método de desaprendizaje dirigido, resuelve el sesgo en la evaluación de conocimiento causal con el benchmark 5WBENCH.